Search results for "aprendizaje por refuerzo"

showing 2 items of 2 documents

Aprendizaje por refuerzo en espacios continuos: algoritmos y aplicación al tratamiento de la anemia renal

2014

El aprendizaje por refuerzo es un paradigma de aprendizaje automático orientado a la resolución de problemas de decisión secuenciales. Este tipo de problemas aparece en aplicaciones pertenecientes a campos tan diversos como control automático, medicina, investigación operativa o economía. Los algoritmos clásicos de aprendizaje por refuerzo están fundamentados en la teoría matemática de la programación dinámica, donde se asume que el espacio de estados es discreto y se compone de un número manejable de estados. Desafortunadamente, en la mayoría de aplicaciones de interés práctico el espacio de estados es continuo, por lo que los algoritmos clásicos dejan de ser útiles. Para poder aplicar el …

:MATEMÁTICAS::Ciencia de los ordenadores::Inteligencia artificial [UNESCO]aprendizaje por refuerzo:MATEMÁTICAS::Estadística::Análisis de datos [UNESCO]programación dinámicaaprendizaje automáticoanálisis de datosUNESCO::MATEMÁTICAS::Estadística::Análisis de datosUNESCO::MATEMÁTICAS::Ciencia de los ordenadores::Inteligencia artificial

researchProduct

Reinforcement learning in a multi-agent framework for pedestrian simulation

2014

El objetivo de la tesis consiste en la utilización de Aprendizaje por refuerzo (Reinforcement Learning) para generar simulaciones plausibles de peatones en diferentes entornos. Metodología Se ha desarrollado un marco de trabajo multi-agente donde cada agente virtual que aprende un comportamiento de navegación por interacción con el mundo virtual en el que se encuentra junto con el resto de agentes. El mundo virtual es simulado con un motor físico (ODE) que está calibrado con parámetros de peatones humanos extraídos de la bibliografía de la materia. El marco de trabajo es flexible y permite utilizar diferentes algoritmos de aprendizaje (en concreto Q-Learning y Sarsa(lambda) en combinación c…

reinforcement learningUNESCO::MATEMÁTICAS::Ciencia de los ordenadores::Simulación:MATEMÁTICAS::Ciencia de los ordenadores::Inteligencia artificial [UNESCO]:CIENCIAS TECNOLÓGICAS::Tecnología de los ordenadores ::Otras [UNESCO]aprendizaje por refuerzoQ-learning and Sarsasimulación de peatones:MATEMÁTICAS::Ciencia de los ordenadores::Simulación [UNESCO]UNESCO::CIENCIAS TECNOLÓGICAS::Tecnología de los ordenadores ::OtrasAprendizaje automáticoUNESCO::MATEMÁTICAS::Ciencia de los ordenadores::Inteligencia artificial

researchProduct